国奖是如何炼成的 | 钱鹏:越过文理学科间的鸿沟
钱鹏同学书写的复旦校歌
2016年复旦大学研究生国奖公示名单上的一个名字:“钱鹏”,曾在一时间吸引许多外界的关注。他在2015年复旦大学中文系本科毕业后,研究生转入计算机学院,并且荣获硕士生国家奖学金(计算机学院共四人获得)。打破一般人所持有的文科生不可能转理的偏见,他似乎在两个完全不同的领域游刃有余,但他自己却认为,自己一直在同一条路上走着,只是使用了不同的方式而已。
和钱鹏刚开始联系时,就得到了他即将前往美国德州参加“自然语言处理实证方法会议”及德国柏林参加“柏林科学周”的消息,而之前的空余时间,日程也是安排的满满当当,因此,直到两周之后,采访才真正开始。
由文至理,以计算机技术来探索语言
回顾钱鹏之前的经历,已经可以用“不走寻常路”来形容:高中时原本是理科生的他,通过参加复旦博雅杯,自主招生进入复旦中文系。在接下来的专业学习中,他发现自己钟爱于将语言作为一种描写和阐释世界的新视角,最终确立语言学作为自己研究的方向。而对后来推免到计算机学院继续研究生阶段的深造的选择,他这样评价:“还是在同一条道路上行走,只是换了不同的方式而已”。
当谈到人文学科与定量分析结合时,他觉得计算机技术提供了一个新的思考维度。为了更清楚地阐明自己的研究方向,他详细地介绍了两种人文学科与定量分析结合的做法。
一种是从统计的角度给出宏观分析。过去文学史、词汇史研究往往采取个案研究的方式,由点及面,要了解一个唐代诗人,需要通过阅读他的作品、年谱及书信往来,以期获得比较全面的认知。词义变化研究亦是如此,需要对大量文本语料进行归纳和分析。但是随着材料的逐渐累积,对个体而言获得更大时空尺度的宏观认识变得愈发困难。计算机技术在这里所扮演的角色,就是辅助大规模的资料分析,以统计的方式对人文研究领域形成更新的理论假说,再由面及点地回归特定的人物或现象。
而另一种方式,即以计算机建模的方式来刻画语言的意义和结构,便是他现在着手进行的研究。具体讲来,就是用人工神经网络等机器学习模型来建模语言数据,理解文本的语义和结构,通过定量实验(即将语法以形式化的方式表达)来寻找语言系统的内在规律,并借助语言学来分析和解释人工智能的黑盒模型。当中的多语言比较,是他个人选择的研究方向。通过在语言学研究中加入定量的因素,来观察各类模型对语法结构差异的反应模式,解释语言学知识如何被模型隐性地习得、编码和表征。经过一系列探索,去年一年,他就在国际人工智能联合会议、国际计算语言学年会、自然语言处理的实证方法上发表了四篇顶级会议论文。
踏实进取,战胜难关,走自己的路
进入计算机学院继续深造的想法,不是他的突发奇想。在进入研究生阶段之前,钱鹏主动征求导师的建议,并为此做了必要的准备:自学数学与编程,阅读相关文献,还参加了计算机学院开放的讨论讲座和讨论班。通过制定计划,每天规律性地抽出额外时间学习,他在知识储备与学科要求都达到了很高的水准。
但钱鹏清楚地认识到,自己的学科背景是最容易引发周围关注的地方,在日常生活中,他也会因此遇到一些偏见与质疑。他坦言,相比纯粹理工科出身的同学,自己在模型的理解深度上可能会有所欠缺,而且专业的跨度也带来了研究视角的系统性转换。起初他也曾因为自己的学科背景感到困惑。但是背景的不同在成为挑战的同时,也造就了机遇。一开始为了寻找研究的切入口,他阅读了大量相关领域的前沿论文,当中,国外学者提到的“跨语言”这样一个关键词,带给了他启发与思考。在综合自己之前的学术积累之后,他选择以语言类型学视角作为自己的研究方向,通过探究当前各类词嵌入模型在语法类型迥异的语言上的共性与差异,来揭示模型隐层单元所编码的不同层级的语言学特征,从而为自己接下来的研究打好了基础。
多方面拓展,让学术进入生活
虽然日常的研究相当繁忙,但他还是乐于组织和参加各种学术交流活动。就在即将启程前往美国的前一天,他一整天的时间都在主持学院研究生会策划的博士生论坛。这次活动中,钱鹏作为前期创意策划的核心成员,很早就参与到论坛的筹备工作中,并和院研究生会的同学一起成功组织了首次跨学科圆桌讨论。
论坛中,来自计算机科学、神经科学、工业界的学者专家共议人工智能与脑科学的发展,从各自的角度阐述智能的研究路径。辛勤的付出得到了回报,这场主题为“人工智能的未来”的论坛获得了同学们的热情回应,不少来自哲学学院、生命科学学院等外系的同学也被吸引参加。
感恩复旦,感恩导师,感恩他人
说到复旦,他认为自己受益于复旦的通识教育,也很认同这样的教育理念。在复旦的经历和成长让他在面对跨学科的研究问题时,勇于尝试和创新,以谦逊的态度尊重和平衡不同学科的话语体系。他非常感谢自己的研究生导师黄萱菁、邱锡鹏教授一直以来的鼓励和支持,以及他们所给予的自由开放的思考空间。他很感谢平日里研究组的同学们无私给予的学习和生活上的帮助,营造了一个自由而又温暖的学术氛围。他也很感谢中文系赋予他的那份对人文的观照,格外珍惜在复旦中文的师生情谊。
实验室同学参与的创意航拍摄影
组成FNLP(Fudan Natural Language Processing)
Natural Language Processing也是实验室大的研究方向
从“柏林科学周”讲开去,以及未来
在采访中,他聊到自己最近在“柏林科学周”之中的见闻。在德意志学术交流中心举办的“上海跨界创新实验室”(“柏林科学周”附属比赛)中夺冠后,他只身前往柏林参加总决赛,并在“柏林科学周”中,与世界各地的学者、艺术家、科学媒体记者对话互动。
当中最令他印象深刻的是,“柏林科学周”期间举办的所有学术交流都呼应着一个主题:柏林墙已被推倒,来自学科之间的壁垒也会被逐渐打破。就在柏林墙倒塌纪念日当天,他作为总决赛选手用三分钟时间向公众介绍了自己的跨学科研究,并聆听了来自全球各地不同研究领域的顶尖学者的学术演讲。这次难忘的经历,带给钱鹏很多感悟,也让他更加坚定了自己的努力方向。
跨学科在钱鹏看来,只是一种技术手段,可能会改变人的思考方式,但不能替代思考本身。对于未来,他期待在计算机科学与语言学的交叉领域继续探索,更专注地思考,做出更多有意义、有意思的研究。他希望自己能够打破学科之墙的束缚,在更广阔的空间里,从多元的维度来理解我们身处的文化和世界。
猜你想看: